Home

Home

13.4 비지도 스킬 발견 (Unsupervised Skill Discovery)

Home / 인공지능 (Artificial Intelligence, AI) / 제목: Embodied AI & Modern Control / Chapter 13. 계층적 강화학습과 스킬 발견 (Hierarchical RL & Skill Discovery) / 13.4 비지도 스킬 발견 (Unsupervised Skill Discovery)

13.4 비지도 스킬 발견 (Unsupervised Skill Discovery)

13.4 비지도 스킬 발견 (Unsupervised Skill Discovery)
13.4.1 보상 없는 학습: 외부 보상 없이 환경과 상호작용하며 유의미한 행동(Skill)을 스스로 학습하는 메커니즘
13.4.2 상호정보량(Mutual Information) 최대화: 상태(State)와 잠재 변수(Latent Variable) 간의 의존성을 이용한 스킬 분화 (DIAYN, VIC 등)
13.4.3 동역학 기반 스킬 학습 (Dynamics-Aware Discovery): DADS(Dynamics-Aware Discovery of Skills)와 모델 기반 접근법

Generated by Rust Site Gen